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摘 E: FAST 脉冲 星 搜索 产生 的 候选 体 诊断 图 量 级 呈 指 数 级 增长 ， 给 科学 数据 管理 工 
作 带 来 挑战 ,迫切 需要 研究 压缩 方法 实现 诊断 图 的 有 效 存 储 和 加 快 其 在 网 络 中 传输 共享 。 脉 
冲 星 诊 断 图 像 由 稀疏 的 黑白 图 像 、 随 机 分 布 的 灰 度 图 和 彩色 图 像 组 成 ,简单 视 为 彩色 图 像 用 
同一 种 压缩 方法 处 理 显然 是 不 合理 的 ,提出 跳 白 块 编码 和 深度 网 络 压缩 编码 压缩 模型 对 脉冲 
星 候选 体 诊断 图 分 区 压缩 ,使 用 近年 来 FAST 巡天 搜索 项 目 脉冲 星 候选 体 诊断 图 来 训练 和 验 
证 。 结 果 表 明 ， 改 进 的 WBS 压缩 稀 朴 黑白 图 像 的 性 能 是 PNG 的 5 倍 ; 深度 网 络 压缩 算法 
处 理 灰 度 图 和 彩色 图 PSNR 性 能 优 于 JPEG 和 JPEG2000 算法 , 与 BPG 算法 性 能 相当 , SSIM 
性 能 远 超 传统 压缩 算法 。 
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1 引 


自 2016 年 9 H 500 米 口径 球面 射电 望远镜 FAST(Five-hundred-meter Aperture Spherical 
radio Telescope) 在 我 国 贵州 落成 由 以 来 ， 脉 冲 星 搜索 一 直 是 FAST 重要 科学 项 目 之 一 。 截 止 
目前 FAST 早期 科学 数据 中 心 已 计算 发 现 了 240 个 新 的 脉冲 星 候选 体 户 ， 其 中 123 颗 脉 冲 星 
候选 体 已 经 证 实 为 新 脉冲 星 。J1859-0131 和 J1931-01 是 我 国 射电 望远镜 首次 发 现 两 颗 新 脉 
冲 星 。J0318+0253 是 FAST 发 现 的 首 个 毫秒 脉冲 星 趾 ,是 至 今 发 现 的 射电 流量 最 弱 的 高 能 毫 
秒 脉冲 星之 一 ,， 展示 了 FAST 对 国际 低频 引力 波 探 测 做 出 实质 贡献 的 潜力 ， 是 FAST 的 重要 
成 果 。 巡 天 观测 数据 经 过 计算 处 理 外 ,产生 海量 级 脉冲 星 候选 体 诊断 图 图 像 ,以 每 天 处 理 2000 
个 数据 文件 为 例 ， 单 日 产生 图 像 就 达 300000 张 ， 存 储 空间 需要 20G， 脉 冲 星 候选 体 诊 断 图 
量 级 呈 指 数 级 增长 , 给 科学 数据 管理 工作 带 来 挑战 。 脉冲 星 候选 体 诊 断 图像 是 天 文科 学 家 们 
对 巡天 数据 进行 检查 、 脉 冲 星 搜 索 判 断 重要 科学 数据 ， 是 探究 新 搜索 技术 方法 的 数据 基础 ， 
是 天 文科 研 科 普 开 放 共 享 的 重要 资源 。 日 常 工作 中 脉冲 星 识 别 软件 在 专用 网 络 中 不 断 传 输 肪 
冲 星 候选 体 诊断 图 像 ， 科 学 家 基于 脉冲 星 候选 体 诊断 图 像 探索 新 的 科研 方法 ， 如 zhu 等 中 
提出 PICS 方法 ，FAST 云 平 台 上 公布 的 共享 信息 包含 大 量 的 脉冲 星 候选 体 诊断 图 。 因 此 ， 
究 压缩 技术 实现 脉冲 星 候 选 体 诊断 图 像 有 效 存 储 与 加 快 其 在 网 络 中 传输 共享 迫切 必要 。 
传统 主流 图 像 标 准 算法 ， 如 JPEGM,JPEG2000!BPG 等 ， 采 用 变换 编码 。JPEG 对 图 像 
分 块 作 DCT 变换 , 将 图 像 信息 从 空间 域 变换 到 系数 能 量 相 对 集中 的 到 DCT 域 , 然后 量化 变 
3 ze BUR ATARE. T JPEG2000 对 图 像 做 离散 小 波 变 换 DWT. 4 hd. fH 
DCT, DWT 变换 是 固定 不 变 的 线性 变换 函数 ， 近 似 固 定 卷 积 核 图 像 卷 积 操 作 ， 手 工 设计 的 
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变换 矩阵 对 脉冲 星 图 像 数据 去 相关 性 不 一 定 是 最 优 的 。 近 年 来 神经 网 络 学 习 的 图 像 压 缩编 码 
方法 [09 越 来 越 受 到 研究 者 青睐 。Toderici 等 中 提出 基于 RNN 图 像 编码 框架 ，Balle 4548 
出 了 基于 卷 积 神经 网 络 的 压缩 编码 结构 , 学习 网 络 瓶 颈 层 数据 表征 的 分 布 炉 模型 , 更 好 地 移 
除了 图 像 的 内 部 见 余 。 基 于 神经 网 络 图 像 压缩 利用 大 量 图 像 优化 学 习 , 在 对 图 像 去 相关 紧凑 
化 压缩 变换 方面 比 传统 手工 设计 压缩 模块 方法 更 有 效 。 但 是 现 有 压缩 方法 都 是 针对 自然 图 像 
的 , 没有 充分 考虑 到 脉冲 星 诊 断 图 像 不 同 于 自然 图 像 特性 。 脉 冲 星 诊断 图 像 由 稀 琉 的 黑白 图 
像 、 随 机 分 布 的 灰 度 图 和 彩色 图 像 组 成 ,简单 视 为 彩色 图 像 用 一 种 变换 压缩 算法 处 理 显然 是 
不 合理 的 。 

针对 脉冲 星 候选 体 诊断 图 的 特征 提出 使 用 跳 白 块 编码 和 和 深度 网 络 图 像 压 缩 模型 相 结 
合 的 压缩 方法 。 针 对 诊断 图 像 的 曲线 和 文字 等 黑白 图 像 ， 首先 二 值 化 图 像 ， 然后 使 用 改进 的 
自 适 应 分 层 跳 块 算法 压缩 。 对 于 深度 神经 网 络 压缩 模型 的 设计 ， 首先 ,图像 压缩 模型 采用 卷 
积 神经 网 络 自 编 码 器 结构 ， 整 体 结构 由 正 向 编码 网 络 、 量 化 器 、 和 编 码 器 和 反 向 编码 网 络 组 
成 。 其 次 ,将 量化 特征 的 编码 率 与 失真 误差 的 加 权 和 作为 损失 函数 ， 利 用 大 量 脉冲 星 候 选 体 
诊断 图 像 自 适应 地 学 习 各 个 模块 函数 ， 基 于 SGD 方法 。 为 了 有 效 使 用 算术 编码 器 工作 ， 对 
洪 在 表示 特征 的 分 布 使 用 网 络 学 习 非 线性 函数 逼近 实际 的 数据 分 布 模型 。 为 了 验证 提出 算法 
的 有 效 性 ， 实 验 将 FAST 近年 来 巡天 项 目 生成 的 脉冲 星 候选 体 诊断 图 作为 数据 集 ， 分 别 应 
用 JPEG, JPEG2000 算法 、BPG 算法 和 本 文 提出 的 DNCM 算法 比较 。 结 果 表 明 , DNCM 算 
法 的 PSNR 值 优 于 JPEG 算法 与 JPEG2000 相当 ， 但 SSIM 值 远 远 超 过 传统 压缩 算法 ， 特 别 
是 在 低 比 特 率 下 重 构图 像 较 高 的 SSIM 值 保 证 了 图 像 感官 质量 。 诊 断 图 本 是 目 视 判 断 脉冲 星 
候选 体 的 辅助 依据 ， 证 明了 提出 的 算法 的 针对 脉冲 星 候选 体 诊断 图 压缩 应 用 的 有 效 性 。 


2 分 区 图 像 压缩 


脉冲 星 候 选 体 诊断 图 是 观测 数据 经 过 消 色 散 、 周 期 折 登 处 理 后 得 到 可 能 的 脉冲 星 旋转 参 
数组 合 和 统计 量 分 布 结果 数据 绘制 图 像 -， 用 于 天 文学 家 判定 是 否 为 脉冲 星 。 如 图 1 所 示 。 
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图 1 脉冲 星 候选 体 诊断 图 像 

Figure 1:Pulsar Candiate Diagnostic Graph 

诊断 图 主要 包含 8 个子 图 ， 可 以 直观 上 可 粗略 分 为 三 类 ， 其 中 2、3 子 图 为 二 维 灰 度 散 

度 图 包含 大 量 随 机 噪声 点 ，1、4、5、6、7 为 稀 朴 的 曲线 图 或 文字 表示 的 黑白 图 像 ，8 为 彩 
色 图 像 。 观 察 可 知 ， 子 图 们 特征 差异 较 大 ， 图 像 通道 数量 不 一 ， 子 图 的 数据 稀 玻 程度 差别 较 
大 ， 显 然 使 用 一 种 单一 的 压缩 算法 或 一 种 压缩 模型 是 不 合理 的 。 本 文 将 图 像 区 域 划分 三 类 ， 
采用 不 同方 法 压缩 编码 , 与 黑白 图 像 区域 使 用 跳 白 块 编码 , 灰 度 图 和 彩色 图 分 别 训练 一 个 深 
度 网 络 隐 变 量 压 缩 模型 。3 类 图 像 区 域 自动 定位 切割 ， 并 分 发 到 对 应 编码 器 压缩 处 理 。 


2.1 跳 白 块 编码 方法 
跳 白 块 编码 是 一 种 充分 利用 二 值 图 像 中 单 色 区 域 占 大 部 分 位 置 的 特征 游程 编码 变 体 ,一 


维 跳 白 块 编码 也 称 跳 白条 ， 将 二 值 图 像 的 各 扫描 行 分 成 若干 块 ， 每 块 N MERK. EAA 
素 的 块 用 1 比特 字 “0” 表 示 ， 对 于 至 少 含 有 一 个 黑 像素 的 块 ， 用 N+1 比特 码 字 表示 ; 含有 
黑色 像素 的 块 的 第 1 个 比特 位 表示 “1” 称 为 前 级 码 ; 其 余 N 比特 直接 自身 的 二 值 幅 值 表示 ， 
白 为 “0”， 黑 为 “1”。 推 广 到 二 维 ， 将 整个 图 像 分 割 为 M xN 像素 的 块 ， 若 块 为 全 白 像 
素 时 用 1 比特 “0” 表 示 ， 非 全 白 块 用 1+AM x N 个 比特 码 字 表 示 ; 一 个 前 级 比特 “1” 其 余 
MN ÈR N 比特 直接 自身 的 二 值 幅 值 表示 。 将 脉冲 星 候选 体 图 像 中 的 1 类 区 域 分 割 出 来 , 指 
定 阔 值 变换 成 为 二 值 图 像 ， 白 色 像 素 用 “0” 表 示 ， 黑 像素 用 “1” 表 示 。 

如 图 2 所 示 , 用 跳 白 块 编 码 二 值 图 像 生成 二 进 制 数据 流 , 再 送 入 自 适应 算术 编码 器 (QM 
编码 器 ) ， 进 一 步 压缩 数据 流 中 的 位 流 见 余 。 其 中 ,在 本 文 使 用 跳 白 块 编码 改进 的 自 适 应 分 
层 跳 块 算法 。 
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图 2 跳 白 块 编码 二 值 图 像 
Figure 2: White Block Skipping Coding for Binary Image 
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图 3 深度 神经 网 络 图 像 压 缩 模型 结构 图 


Figure 3.:Architecture Diagram of Deep Neural Network Image Compression Model 


2. 2 深度 网 络 隐 变 量 压缩 模型 

- 对 于 灰 度 图 像 和 彩色 图 像 , 本 文 分 别 训练 两 个 学 习 型 的 深度 网 络 隐 变 量 压缩 模型 压缩 相 
Q 点 的 图 像 块 。 深 度 网 络 隐 变 量 压 缩 模 型 的 整体 网 络 结构 是 一 个 自 编码 器 结构 ， 如 图 3 所 示 ， 
压缩 网 络 模型 包含 四 个 部 分 组 成 : 分 析 变 换 网 络 模块 Encoder、 量 化 器 Quantizer, JàiZgj t ps 
块 Entropy Coder 和 集成 变换 网 络 模块 Decoder。 分 析 变 换 网 络 Encoder AZANIA REFR 
层 组 成 , 经 过 一 系列 下 采样 ,提取 特征 去 相关 等 变换 操作 ， 将 输入 图 像 映 射 到 弱 相 关 的 紧凑 
的 隐 变 量 表示 。 潜在 表示 保留 了 图 像 的 全 部 必要 信息 ， 是 待 编码 的 压缩 信息 。 集 成 变换 网 络 
是 Encoder 的 逆 操 作 ， 也 是 由 一 系列 堆 著 的 道 卷 积 层 组 成 ,通过 上 采样 生成 图 像 信 
E 。 炉 编码 模块 Entropy Coder 是 依赖 神经 网 络 学 习 得 到 的 潜在 表示 分 布 的 参数 估计 的 模型 ， 

指 8 导 算 术 编 码 器 将 被 量化 器 量化 后 的 潜在 表示 信息 生成 可 以 保存 和 网 络 传输 的 二 进 制 码 流 ， 
即 压 缩 信 息 。 

分 析 变 换 E,(x) 图 像 特 征 数据 x 映射 为 潜在 表示 y, 量化 器 Quantizer 将 量化 为 》,，y 
RRE Q(y;0) 中 逼近 潜在 表示 的 统计 分 布 ， 指 导 算 术 编 码 器 将 》 编 码 为 二 进 制 流 ; 解码 时 
算术 编码 器 依赖 粮 模 型 将 二 进 制 流 重新 译 成 量化 特征 》， 集 成 变换 D(z) 将 根据 了 》 的 信息 

生成 图 像 x' 。 这 其 中 主要 模块 为 分 析 变 换 器 E, GO) . REUS QCy; 0) 和 集成 变换 器 D, (z) o 
与 传统 的 变换 编码 方法 不 同 ,它们 都 是 利用 大 量 图 像 优 化 学 习 优化 得 到 的 , 而 非 手 工 设计 的 。 


[i 


China hi AdE HHIII 
ChinaXiv 合 作 期 刊 


神经 网 络 基于 一 个 损失 函数 ， 反 向 传播 误差 梯度 ， 学 习 得 到 模型 的 参数 (办 CQ,V) ， 以 权 值 和 
偏 置 形式 保存 在 神经 网 络 中 。 本 文采 用 RDO 优化 策略 学 习 网 络 ， 即 联合 图 像 压 缩 损失 和 码 


率 函数 ， 拉 格 朗 日 乘 子 太 控 制 着 码 率 与 率 失真 的 平衡 。 如 公式 (D) 表 示 。 
L- D(x, 3) + BH(3) (D 


st. H(9) --log;5p) , DG, 3) 2 |x- 3|, 


2.2.1 量化 器 

由 于 压缩 编码 的 需要 对 潜在 表示 层 输出 》 量化 处 理 ， 通 常 使 用 取 整 round, 操作。 本文 

采用 量化 器 量化 间隔 步 长 为 1， 用 间隔 的 中 心 来 表示 量化 输出 。 量 化 公式 如 下 ; 
$; =q; = round(y;) (2) 

其 中 ， 指 示 符 1 贯穿 向 量 的 所 有 元 素 ， 包 括 通道 和 空间 坐标 。 这 样 做 的 好 处 是 ，y》 的 的 
边际 密度 可 以 用 一 个 可 训练 的 离散 概率 质量 函数 得 到 ， 其 权重 等 价 于 概率 质量 函数 qg; 。 如 
下 一 小 节 中 ， 公 式 OD 连续 变量 的 边际 密度 可 以 由 离散 的 概率 密度 函数 的 单位 1 的 累积 密 
度 函 数 上 下 限 差 值 逼 近 得 到 。 

然而 分 析 损失 函数 公式 〈1) 可 以 发 现 ， 损 失 函 数 依赖 于 量化 值 ， 但 是 取 整 量化 函数 的 
梯度 几乎 总 是 0， 使 得 码 率 R 与 失真 D 组 成 的 损失 函数 不 可 微 , 这 就 导致 无 法 再 使 用 梯度 下 
降 优 化 损失 。 为 了 继续 能 够 使 用 随机 梯度 下 降 优 化 ， 在 训练 过 程 中 , 我 们 加 入 独立 同 分 布 的 
随机 均匀 噪声 & 的 实现 拌 动 的 量化 器 ，& 的 分 布 区 间 和 量化 器 的 量化 间隔 的 宽度 都 等 于 1; 
在 测试 和 实际 编码 过 程 中 ， 我 们 直接 使 用 取 整 函数 ， 如 公式 (3 表示 。 
round(y, +£), &-u(-0.5,0.5) 

n zd , when testing 


2. 2. 2 分 段 线 性 函数 焙 模 型 

图 像 压缩 模型 需要 对 分 析 变 换 得 到 的 紧凑 的 潜在 表示 信息 无 损 编码 ， 生 成 二 进 制 码 流 ， 
本 文采 用 算术 编码 实现 炳 编码 ,算术 编码 算法 是 一 种 基于 信 源 信息 统计 的 概率 分 布 将 所 有 编 
码 信息 映射 到 实 轴 上 [0,3) 内 的 小 区 间 表 示 的 最 优 无 损 烂 编码 算法 。 算 术 编 码 的 基础 是 的 潜在 


(3) 


表示 分 布 模型 的 精准 估计 ， 影 响 码 率 R 和 损失 D， 即 压缩 器 的 压缩 性 能 ， 我 们 使 用 一 个 网 络 
一 无 参数 分 段 线性 密度 函数 模型 遇 近 实际 数据 的 分 布 。 
= 假定 潜在 表示 空间 中 数据 是 独立 同 分 布 , 则 可 以 建立 一 个 完全 因子 分 解 模型 ， 其 似 然 函 
数 为 样本 的 积分 ， 如 公式 〈4) 。 概 率 密度 模型 有 潜在 表示 数据 先 验 分 布 密度 函数 卷 积 一 个 
标准 均匀 分 布 密度 函数 得 到 , 将 编码 器 的 输出 特征 映射 作为 输入 , 生成 潜在 表示 特征 的 概率 


p, GQ = [ [5(4(y2*uC0.5.05) 


=c(y - 0.5) - c(y; - 0.5) 


(4) 


参考 ”设计 一 个 基于 深度 神经 网 络 的 无 参数 分 段 线性 密度 函数 模型 ， 通 过 迭代 训练 优化 
实现 样本 数据 与 模型 之 间 的 拟 合 。 使 用 卷 积 网 络 构建 的 无 参数 分 段 线性 密度 函数 ， 包 括 K 
个 阶段 的 非 线 性 变换 函数 卷 积 ， 其 中 第 K 阶段 向 量 映射 函数 fo: R” R", KE fe HE 
度 廊 的 梯度 ， 是 一 个 雅克 比 和 矩阵 ， 可 以 将 模型 的 累计 密度 链 式 计算 法 则 表示 如 下 : 
c= fe Ofg 4^ fi so» 
p fgfea^ fy 


非 线性 函数 具体 实现 公式 如 下 : 
万 CO 9 g CH ?x e p?) 

f, Q) = sigmoid (H ? x - D?) 
g, (x)= x * a? otanh(x) 


分 布 。 


多 式 ， 使 用 非 线性 


3 实验 与 结果 分 析 


SCUSA 


模型 ， 数 据 源 包 括 脉 六 


FE 来 FAST 脉 六 


HAE 


Ed 


]xk«K 


其 中 Jt( 表示 量化 函数 前 面 1< K < K 层 变换 函数 


星 搜 索 巡 天 项 目的 
图 像样 本 1159 个 和 RFI 图 


了 分 结果 数据 作为 
像样 本 998 个 8 


(6) 
(7) 
(8) 


ast fx (加 为 量化 函数 最 后 一 层 函数 
激活 函数 OO 将 概率 分 布 映射 到 一 个 [0, 1] 区 间 ， 即 是 概率 密度 的 标准 分 


图 像 压 缩 训 练 集 
位 无 损 PNG 图 


和 测试 
像 。 网 


络 模型 是 在 NVIDIA GeForce GTX 1080 GPU 上 使 用 Pytorch 框架 实现 的 。 为 了 验证 提出 算 


法 性 能 ， 随 机 从 测试 集中 抽取 5 幅 脉 冲 星 
码 压缩 和 PNG 压缩 结果 比较 ; 灰 度 
JPEG2000. BPG 算法 比较 。 其 中 , JPEG XH 
BPG 使 用 开源 库 libbpg。 
3.1 跳 白 块 编码 过 程 
分 割 候选 体 诊断 图 中 1 类 图 像 区 域 ， 
Jj Exe x BREN 200, 将 
断 图 像 压 缩 实验 ， 选 取 最 优 跳 白 块 尺寸 大 小 为 5X4， 获 得 最 优 
送 入 QM 算术 编码 器 。 


3. 2 深度 网 络 模型 结构 


A 


样 。 本 文 设计 的 压缩 网 络 ， 

层 ， 4 个 ResNet 层 。 卷 积 层 
充 位 4; 第 2 和 第 3 个 卷 积 层 有 128 个 5x5 卷 积 核 ， 
积 层 ， 步 长 2?， 填 充 2， 可 


ERI 
图 和 彩色 


此 类 


关节 通道 数 指定 16x16 ril 


象 ， 测 试 压缩 信 
图 区 域 ， 将 本 文 设计 的 深度 压缩 算法 与 JPEG、 
开源 库 libjpeg, JPEG2000 使 用 openjpeg 实现 ， 


图 像 区 域 为 稀 朴 的 黑 
图 像 二 值 化 映射 为 {0,1}。 其 次 选择 跳 


编码 器 的 输入 与 输出 尺寸 一 致 , 即 输入 图 像 的 大 小 通道 数 与 压缩 模型 重 构 
图 像 块 大 小 256x256,Encoder 模块 包括 4 个 卷 积 层 和 3 个 GDN 
2 倍 下 采样 ， 第 1 个 卷 积 层 月 


法 。 对 黑白 


H 128 个 9x9 的 卷 积 核 ， 


图 像 处 理 后 使 用 跳 白 


pL 


图 像 , 计算 像素 幅 值 直 
RRT, 经 过 大 量 候选 体 诊 
压缩 码 流 。 最 后 跳 白 块 编码 后 


pa 


图 像 大 小 一 


步 长 2， 填 


步 长 为 2， 填 充 2，bottleneck 层 也 是 卷 


FE 图 数量 控制 码 率 。Decoder 模块 的 与 


Encoder 模块 参数 相似 ，Conv2d 替换 为 ConvyTranspose2d， 顺 序 相反 。 


本 文 的 网 络 模型 基于 RDO 优化 ， 即 
函数 ， 针 对 灰 度 图 和 彩色 图 
Distortion 与 Rate 组 
练 了 10 中 入 模型 ， 入 取 值 (16,3 
计算 法 (ADAM) Rh 


代 优 


然后 基于 这 个 模型 作为 预 训练 模 


训练 了 两 类 上 


[v 


缩 模型 。 


压缩 损失 Distortion 和 码 率 Rate 联合 作为 目标 损失 
LrB 入 为 拉 格 肯 


日 乘 子 ,用 作 调 节 不 同 的 


3. 3 实验 结果 与 分 析 


Bk E 


合 满足 不 同 ) 


块 编码 性 能 评价 。 将 候选 体 诊断 图 


化 模型 ， 初 始 学 习 率 为 10” ， 动 量 因 
上 次数 设置 为 100000 次 ， 每 次 迭代 的 训练 样本 批 次 大 小 为 16。 首 先 训练 高 码 率 模 型 ， 
型 分 别 调整 入 值 训练 


中 1 类 


= 缩 质 量 要 求 的 场景 ， 即 可 变 码 率 压 缩 。 在 实验 中 ， 我 们 训 
2,64,128,512,1024,2048,4096,6144,8192) 。 以 自 适 应 动量 估 
子 为 0.99， 权 重 衰减 率 10”。 和 迭 


N 


图 像 区域 ， 


他 模型 。 


用 改进 的 was 压缩 的 结果 与 


WBS 基本 压缩 和 PNG 压缩 结果 比较 ， 如 表 1 所 示 ， 结 果 显 示 改 进 的 WBS 压缩 性 能 是 PNG 


的 5 倍 ， 


白 图 像 基 本 相同 ，PNG 


图 像 边 缘 更 平滑 。 


加 入 了 QM 的 WBS 压缩 性 能 得 到 进一步 提升 ， 从 


图 5 可 以 看 到 ，PNG 和 WBS 的 黑 


表 1 跳 白 码 编码 与 PNG 编码 比较 
Table 1: Compare Preformance of WBS and PNG 
img1 img2 img3 img4 img5 
num of bits 237866 238666 235646 231986 243126 
TER bpp 0.23 0.23 0.23 0.22 0.23 
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num of bits 1020392 1079816 1038808 970120 1114472 
PNG 
bpp 0.98 1.03 0.99 0.93 1.07 
NEW num of bits 201548 202144 199230 196092 206869 
WBS bpp 0.193 0.194 0.191 0.188 0.198 
2 Pulses of Best Profile Search Information 


Candidate: 15.14ms, Cond RA 2o00 = 20:51:41.4500 DEC ,2000 = 45:32:07.8000 
Telescope: FAST Folding Porometers 


| | | | Epochpo = 58242.95401759259 DOF, = 44.53 Xs = 17.014 P(Noise) < 2.16e-183 (28.90) 


Epochoon = 58242.95348284396 Dispersion Meosure (DM; pe/em’) = 448.000 


Tai Pig, (ms) = 15.141968(17) — Pi, (ms) = 15.142658(17) 

N- Dato folded = 520192 Prog, (8/5) = -2.6(1.2)x107% — Pi (s/s) = 一 2.6(1.2)x10-， 

| Dota Avg = 3.481e+04 Pope (5/5^) = 0.0(7.8)x10 Pay (s/s?) = 0.0(7.8)107 
Dato StdDev = 21! Binary Porameters 
| | y Profile Bins = 64 Poa (s) = N/A e = N/A 
Profile yg = 2.83e+08 e,sin()/c (s) = N/A w (rod) = N/A 
Profile StdDev = 1.903e+04 Tperi = N/A 
1 z 
(a) PNG 
2 Pulses of Best Profile Search Information 
Candidate: 15.14ms Cond Roo, = 20:51:41.4500 DEC 2000 = 45:32:07.8000 


Telescope: FAST Folding Parameters 

poca, = 58242.95401759259 DOF yy = 4453 2 = 17014. P(Noise) < 2.166183 (2899) 
Epoche, = 58242.95348284396 Dispersion Mecsure TOM; pc/cm') = 448.000 

T, = 0.000 Pupo (ms) = 15.141968(17) — P, (ms) = 15.142658(17) 


L Qoi Folded = 520192 Pus (s/s) = -280.2103 Pras (s/s) = -2.8(1.2)x10 
Doto Avg = 3.481e+04 Pug, (5/5) = 0.0(7.8)x107"! Pary (s/s’) = 0.0(7.8)x107" 
Dota StdDev = 211 Binary Parameters 
Profile Bins = 64 Pa (5) = N/A e = N/A 
Profile Avg = 2.83e+08 olsin()/e (s) = N/A w (rod) = N/A 
Profile StdDev = 1903404 Tpi = N/A 

(b) WBS 


图 4 黑白 图 像 的 PNG 和 WBS 无 损 压 缩 结果 对 比 
Figure 4: Visual Comparsion of Lossless Compression with PNG and WBS 
网 络 模 型 客观 评价 。 设 置 灰 度 图 像 区 域 和 彩色 图 像 的 神经 网 络 潜在 表示 层 通道 数 分 别 为 
N=64,128, 下 采样 倍率 为 16， 训 练 深度 网 络 压缩 模型 。 由 于 两 类 模型 方法 相同 , 受 篇 幅 限制 ， 
文中 仅 描述 彩色 图 像 网 络 模型 在 不 同 码 率 下 的 PNSR 和 SSIM 性 能 。 实 验 结果 如 图 5-b 为 
PSNR-Rate 曲线 ,反映 各 种 算法 在 不 同 码 率 下 解码 图 像 与 原本 图 像 像素 之 间 均 方 误差 。 整体 
上 ， 提 出 深度 网 络 压 缩 模 型 (DNCM) 算 法 性 能 与 JPEG2000 相近 ， 明 显 优 于 JPEG 算法 但 不 
及 BPG 算法 ,在 bpp 为 0.4 时 ,我 们 DNCM 的 PSNR 值 为 31dB, 与 JPEG2000 交叉 , 比 JPEG 
高 1.44B， 比 BPG 算法 低 8dB。 压 缩 效果 就 明显 优 于 JPEG 和 JPEG 压缩 算法 ， 接 近 于 BPG 
算法 。 接 近 无 损 压 缩 时 ,传统 压缩 算法 超出 神经 网 络 方法 ,这 是 卷 积 神经 网 络 的 过 平滑 造成 
的 .图 5-b 为 SSIM- 码 率 曲 线 , 反映 各 种 算法 在 不 同 码 率 下 解码 图 像 与 原本 图 像 图 像 结构 相似 
度 SSIM.BNCM 算法 明显 高 于 JPEG 和 JPEG2000 算法 , 略 高 于 BPG 算法 .在 bpp 为 0.2 时 ， 
DNCM 算法 的 SSM 值 高 于 0.99, 而 最 好 的 传统 算法 BPG 的 SSIM 值 为 0.95, 而 bpp<0.7 时 ， 
DNCM 算法 SSM 依然 高 于 0.95, 说 明 在 较 低 比特 率 高 压缩 比 情况 下 ，DNCM 算法 在 保持 图 
像 感 知 质量 上 的 绝对 优势 。 
网 络 模型 主观 评价 。 如 图 6 所 示 ， 展 示 了 不 同 的 图 像 压缩 算法 在 相近 码 率 的 视觉 结果 。 
可 以 看 到 ，JPEG 算法 出 现 块 效应 ， 我 们 提出 的 DNCM 算法 多 数 情况 下 与 BPG 性 能 相近 ， 
比 JPEG 和 JPEG2000 效果 好 ， 图 中 两 幅 诊 断 图 彩色 图 在 相对 小 的 码 率 下 取得 最 好 的 视觉 质 


E3 


AZ, WkrbiEYZNIEVSEACECMRENLDU HZ. EIRE nx BE EDRUEZ ERRIR, EF 
传统 的 有 损 压 缩 算法 都 不 是 最 优选 择 , 而 本 文 依据 分 区 策略 利用 跳 白 块 编码 和 神经 网 络 压缩 
模型 对 诊断 图 像 压 缩 具 有 针对 性 专用 性 。 曲 线 文字 图 像 块 , 转化 为 二 值 图 像 后 跳 白 块 压缩 几 
乎 没有 损失 却 得 到 极 高 的 压缩 比 ;特别 是 网 络 压缩 模块 的 功能 函数 是 利用 大 量 的 诊断 图 学 习 
得 到 ， 最 大 程度 反映 了 诊断 图 像 数 据 空间 特征 ， 进 一 步 反 应 得 到 模型 的 专用 性 。 脉冲 星 诊断 
图 最 重要 的 作用 是 辅 肋 人 类 目 视 判断 脉冲 星 候 选 体 , 识 图 时 观测 的 重点 就 是 曲线 图 像 的 结构 
和 这 子 图 图 像 中 结构 信息 ， 本 文 提出 算法 在 低 比特 率 下 任 保 持 较 高 的 SSIM 值 反映 了 视觉 感 
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PSNR(dB) 
w 


SSIM 
o 


图 5 图 像 压缩 PSNR、SSIM 性 能 率 失真 曲线 比较 
Figure 5 : Rate-Distortion Curves of Image Compression Using PSNR and SSIM Metric 


im. le, RU, e, c, IN 


aca ca ackca aca a dac RS à aaa aca ca doa a 


0.29bpp/2.40dB/0.658 


BPP/PSNR/MS-MSSIM 0.51Ibpp/21.4dB/0.623 0.489bpp/24.3dB/0.757 0.49bpp/25.5dB/0.774 — 0.4878bpp/31.96dB/0.986 
RAW JPEG JPEG2000 BPG DNCM 
图 6 可 视 化 结果 比较 JPEG.PEG2000,BPG 和 DNCM 的 质量 
Figure 6 : Visual Comparsion among JPEG,JPEG2000,BPG,DNCM and Original Image 


4 结束 语 


脉冲 星 诊断 图 像 由 稀 玻 的 黑白 图 像 、 随 机 分 布 的 灰 度 图 和 彩色 图 像 组 成 ,简单 视 为 彩色 
图 像 用 一 种 变换 压缩 算法 处 理 显 然 是 不 合理 的 .为 此 ， 本 文 提 出 跳 白 块 编码 和 深度 网 络 压缩 
方法 对 诊断 图 像 分 区 压缩 。 跳 白 块 编码 是 针对 单 色 区 域 占 大 部 分 的 二 值 图 像 具 有 较 好 压缩 效 
果 的 方法 , 提取 脉冲 星 诊断 图 中 的 曲线 子 图 和 文字 描述 子 图 ， 选 定量 化 阐 值 ， 将 图 像 二 值 化 
为 比特 位 矩阵 表示 的 图 像 ,， 选取 最 优 跳 白 块 尺寸 实现 WBS 编码 后 送 入 QM 压缩 器 进一步 提 
升 压缩 性 能 ， 最 终 压缩 比 是 PNG 的 5 倍 。 基 于 深度 网 络 压 缩 方法 对 灰 度 图 和 彩色 图 分 别 训 
练 模 型 。 深 度 网 络 压缩 模型 是 由 卷 积 神经 网 络 实现 的 自 编 码 器 结构 ， 由 分 析 变 换 编 码 网 络 、 
量化 器 、 炉 编码 器 和 合成 变换 编码 网 络 组 成 。 各 个 压缩 模块 均 由 学 习 方法 利用 大 量 脉 冲 星 候 
选 体 诊断 图 像 优化 ; 变换 映射 能 力 比 传 统 手 工 设计 模块 更 有 效 , 图 像 经 过 分 析 变 换 映 射 为 潜 
在 表示 , 是 去 相关 的 更 紧凑 的 图 像 信息 表示 ; 学 习 到 的 炉 编 码 模块 是 对 潜在 表示 空间 的 分 布 
WME, 是 比 累积 概率 直方 图 更 精准 的 更 容易 操作 的 概率 模型 , 指导 基于 统计 分 布 的 算 
术 编 码 器 无 损 编码 。 实 验 结果 表明 , 提出 深度 网 络 压 缩 算法 对 近年 来 FAST 巡天 搜索 项 目 脉 
冲 星 候 选 体 诊断 图 的 压缩 性 能 , 在 PSNR 比较 上 优 于 JPEG 算法 与 JPEG2000 相当 , 而 SSIM 
性 能 比较 远 超过 传统 压缩 算法 。 本文 充分 利用 子 图 间 特 征 显 著 差 异性 , 制定 分 区 压缩 策略 将 
图 像 分 成 三 类 子 图 区 域 ， 依 赖 子 图 图 像 特征 分 别 使 用 WBS 和 深度 网 络 压缩 方法 ， 提 升 了 编 


码 效 率 。 我 们 也 观察 到 ， 本 文中 利用 神经 网 络 实现 的 炉 估 计 模 型 是 十 分 简洁 易 操 作 的 方式 ， 
估计 的 炉 模 型 是 否 能 够 精准 有 效 性 匹配 真实 的 潜在 分 布 直接 影响 码 率 Rate 和 损失 
Distortion， 因 此 ， 考 虑 新 方法 提高 炉 模 型 的 精准 估计 可 以 进一步 改善 压缩 性 能 。 
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Abstract: The magnitude of candidate diagnostic images generated by FAST pulsar search 
has increased exponentially, which brings challenges to scientific data management. It is urgent to 
study compression methods to achieve effective storage of diagnostic images and speed up their 
transmission and sharing in the network. It is not reasonable to simply treat the whole image as a 
color image and compress it with the same method. We propose a skip white block coding and a 
deep network compression coding model to compress pulsar candidate diagnostic images. we 
take the pulsar candidate diagnostic images from recent FAST sky survey search projects to train 
and verify the model. The results show that the performance of the improved WBS compression 
for sparse black and white images is 5 times than PNG. The performance of deep network 
compression algorithm for PSNR is better than JPEG and JPEG2000, comparable to BPG.And it 
is much better than traditional compression algorithm for SSIM. 

Key words: Pulsar Candidate Diagnostic Image Compression; Deep network compression 
model ;WBS; FAST 


